专利摘要:
本發明描述用於基於一未經剪取版本之一運動向量預測符候選對一視訊區塊進行寫碼之技術。該等技術包括在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單。更具體言之,若該等運動向量預測符候選中之一者指向相對於當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則該等技術允許一未經剪取版本之該運動向量預測符候選包括在該候選清單中。接著基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。消除該運動向量預測符候選剪取程序降低了視訊編碼器及視訊解碼器兩者之複雜度。
公开号:TW201316782A
申请号:TW101133371
申请日:2012-09-12
公开日:2013-04-16
发明作者:Muhammed Zeyd Coban;Marta Karczewicz
申请人:Qualcomm Inc;
IPC主号:H04N19-00
专利说明:
用於視訊寫碼之運動向量預測符候選剪取移除
本發明係關於視訊寫碼,且更特定言之,係關於視訊框間編碼技術。
本申請案主張於2011年10月4日申請之美國臨時申請案第61/543,181號及於2011年10月28日申請之美國臨時申請案第61/553,053號之優先權,該兩個申請案之全文特此以引用之方式併入。
可將數位視訊能力併入於廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲主機、蜂巢式或衛星無線電電話、視訊電話會議器件及其類似者。數位視訊器件實施視訊壓縮技術(諸如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊寫碼(AVC))、當前處於開發狀態中之高效率視訊寫碼(HEVC)標準定義之標準及此等標準之擴展中所描述之視訊壓縮技術)以更有效率地傳輸、接收及儲存數位視訊資訊。
視訊壓縮技術可包括空間(框內圖像)預測及/或時間(框間圖像)預測以減少或移除視訊序列中所固有之冗餘。對於基於區塊之視訊寫碼,可將視訊切片分割成視訊區塊,視訊區塊亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之框內寫碼(I)切片中的視訊區塊。圖像之框間寫碼(P或B)切片中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間或時間預測使用針對待寫碼之區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼框內寫碼區塊。為進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生可經量化之殘餘變換係數。可按特定次序掃描最初配置成二維陣列之經量化之變換係數以產生變換係數之一維向量以用於熵寫碼。
大體而言,本發明描述用於基於一未剪取版本之運動向量預測符候選對一視訊區塊進行寫碼之技術。該等技術包括在不剪取運動向量預測符候選之情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單。若該等運動向量預測符候選中之一者指向相對於當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則本發明之該等技術允許一未剪取版本之該運動向量預測符候選包括於該候選清單中。若判定該未剪取運動向量預測符候選係用於一運動向量預測程序中,則可剪取該未剪取運動向量以在一運動補償程序期間將該預測區塊重定位於圍繞該參考圖像之一填補區域內。
在當前HEVC測試模型(HM)中,支援兩種運動向量預測模式:合併模式及自適應性運動向量預測(AMVP)模式。在任一模式中,視訊寫碼器件判定藉以判定當前視訊區塊之運動向量預測符的運動向量預測符候選清單。傳統上,若運動向量預測符候選中之任一者指向相對於當前視訊區塊位於參考圖像邊界外側的預測區塊,則視訊寫碼器件將剪取該運動向量預測符候選以確保整個預測區塊重定位於圍繞參考圖像之填補區域內。
根據本發明之該等技術,運動向量預測符候選剪取程序得以自候選清單產生程序移除。具體言之,當候選清單之一運動向量預測符候選指向位於參考圖像邊界外側的預測區塊時,視訊寫碼器件將不會剪取或以其他方式截斷運動向量預測符候選之值。接著基於候選清單之已判定之未經剪取運動向量預測符候選對當前視訊區塊進行寫碼。若判定來自候選清單之運動向量用於運動補償,則可將剪取該運動向量。消除運動向量預測符候選剪取程序降低了視訊編碼器及視訊解碼器兩者的複雜度。
在本發明之一實例中,提出一種用於對視訊資料進行寫碼之方法。該方法包含在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中,且基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。
在本發明之另一實例中,提出一種經組態以對視訊資料進行寫碼之裝置。該裝置包含:用於在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單之構件,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中;及用於基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼之構件。
在本發明之另一實例中,提出一種經組態以對視訊資料進行寫碼之裝置。該裝置包含一視訊寫碼器,該視訊寫碼器經組態以在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中,且基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。
在本發明之另一實例中,提出一種儲存用於使得一處理器經組態以對視訊資料進行寫碼之指令的電腦可讀媒體。該處理器經組態以在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中,及基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。
於隨附圖式及以下描述中陳述一或多個實例之細節。其他特徵、目的及優勢將自該描述及該等圖式以及自申請專利範圍顯而易見。
圖1為說明可利用本發明中所描述之框間預測技術的實例視訊編碼及解碼系統10之方塊圖。如圖1中所展示,系統10包括一源器件12,源器件12產生稍後待由目的地器件14解碼之經編碼之視訊資料。源器件12及目的地器件14可包含廣泛範圍之器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板型電腦、機上盒、電話手機(諸如,所謂「智慧型」電話)、所謂「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台,或其類似者。在一些狀況下,源器件12及目的地器件14可針對無線通信而裝備。
目的地器件14可經由鏈路16接收待解碼之經編碼之視訊資料。鏈路16可包含能夠將經編碼之視訊資料自源器件12移至目的地器件14之任何類型的媒體或器件。在一實例中,鏈路16可包含用以使源器件12能夠將經編碼之視訊資料直接即時傳輸至目的地器件14之通信媒體。可根據通信標準(諸如,無線通信協定)調變經編碼之視訊資料,並將經編碼之視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的其他任何設備。
在另一實例中,經編碼視訊亦可儲存於儲存媒體34或檔案伺服器36上,且可在需要時由目的地器件14存取。儲存媒體可包括多種在本端存取之資料儲存媒體中之任一者,諸如,藍光光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼之視訊資料之其他任何合適數位儲存媒體。儲存媒體34或檔案伺服器36可為可保持藉由源器件12產生之經編碼視訊且目的地器件14可在需要時經由串流傳輸或下載而存取的其他任何中間儲存器件。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14之任何類型之伺服器。實例檔案伺服器包括web伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼之視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之組合。經編碼之視訊資料自檔案伺服器之傳輸可為串流傳輸、下載傳輸,或兩者之組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用(諸如,(例如)經由網際網路之空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸)中之任一者之視訊寫碼、供儲存於資料儲存媒體上之數位視訊之編碼、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括一視訊源18、視訊編碼器20及一輸出介面22。在一些狀況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如視訊俘獲器件(例如,視訊攝影機、含有先前俘獲之視訊的視訊封存檔、用以自視訊內容提供者接收視訊之視訊饋入介面)之源,及/或用於產生電腦圖形資料作為源視訊之電腦圖形系統之源,或此等源之組合。作為一實例,若視訊源18為視訊攝影機,則源器件12與目的地器件14可形成所謂的攝影機電話或視訊電話。然而,一般而言,本發明中所描述之技術適用於視訊編碼,且可應用於無線及/或有線應用。
可由視訊編碼器20來對所捕獲、預捕獲或電腦產生之視訊進行編碼。經編碼視訊資訊可根據通信標準(諸如,無線通信協定)藉由數據機22調變且經由傳輸器24傳輸至目的地器件14。數據機22可包括各種混頻器、濾波器、放大器或經設計以用於信號調變之其他組件。傳輸器24可包括經設計以用於傳輸資料之電路,包括放大器、濾波器及一或多個天線。
在圖1之實例中,目的地器件14包括接收器26、數據機28、視訊解碼器30及顯示器件32。目的地器件14之接收器26經由頻道16接收資訊,且數據機28解調變該資訊以產生用於視訊解碼器30之經解調變位元串流。經由頻道16傳達之資訊可包括由視訊編碼器20所產生之供視訊解碼器30在對視訊資料進行解碼時使用的多種語法資訊。此語法亦可包括於儲存於儲存媒體34或檔案伺服器36上之經編碼視訊資料內。視訊編碼器20及視訊解碼器30中之每一者可形成能夠對視訊資料進行編碼或解碼之各別編碼器-解碼器(編解碼器)的部分。
顯示器件32可與目的地器件14整合或在目的地器件14外部。在一些實例中,目的地器件14可包括整合式顯示器件,且亦經組態以與外部顯示器件介接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向使用者顯示經解碼之視訊資料,且可包含多種顯示器件中之任一者,諸如,液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據視訊壓縮標準(諸如,目前在開發中的高效率視訊寫碼(HEVC)標準)而操作,且可符合HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準或者被稱作MPEG-4第10部分(進階視訊寫碼(AVC)之其他專屬或工業標準或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263。
雖然未展示於圖1中,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體以處置共同資料流或獨立資料流中之音訊及視訊兩者的編碼。若適用,則在一些實例中,MUX-DEMUX單元可遵照ITU H.223多工器協定,或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30可各自實施為各種適宜編碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地在軟體中實施時,一器件可將用於軟體之指令儲存於合適的非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中任一者可整合為各別器件中之組合編碼器/解碼器(編解碼器(CODEC))的部分。
視訊編碼器20可實施本發明之技術中之任一者或全部以對運動向量進行寫碼。作為一實例,視訊編碼器20可經組態以在不剪取運動向量預測符候選的情況下自相鄰視訊區塊選擇包括運動向量預測符候選之運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於當前視訊區塊位於參考圖像邊界外側的預測區塊,則將未經剪取版本之運動向量預測符候選係包括於候選清單中,及基於該候選清單之已判定之未經剪取運動向量預測符候選來對當前視訊區塊進行寫碼。
同樣地,視訊解碼器30可實施本發明之技術中之任一者或全部以對運動向量進行寫碼。作為一實例,視訊解碼器30可經組態以在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於當前視訊區塊位於參考圖像邊界外側的預測區塊,則未經剪取版本之運動向量預測符候選係包括於候選清單中,及基於該候選清單之已判定之未經剪取運動向量預測符候選來對當前視訊區塊進行寫碼。
如本發明中所描述之視訊寫碼器可指代視訊編碼器或視訊解碼器。類似地,視訊編碼器及視訊解碼器可分別被稱為視訊編碼單元及視訊解碼單元。同樣地,視訊寫碼可指視訊編碼或視訊解碼。
視訊寫碼聯合協作組(JCT-VC)當前正從事於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。舉例而言,鑒於H.264提供9個框內預測編碼模式,HM可提供多達35個(33個方向型、1個DC型和1個平面型)框內預測編碼模式。
一般而言,HM之工作模型描述視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)序列。樹型區塊具有與H.264標準之巨集區塊之目的類似的目的。切片包括按編碼次序之數個連續樹型區塊。可將視訊圖框或圖像分割成一或多個圖塊。每一樹型區塊可根據四分樹而分裂成若干寫碼單元(CU)。舉例而言,樹型區塊(作為四叉樹之根節點)可分裂成四個子節點,且每一子節點可又為父節點,且分裂成另外四個子節點。最後未分裂之子節點(作為四叉樹之葉節點)包含一寫碼節點,亦即,經寫碼之視訊區塊。與經寫碼之位元串流相關聯之語法資料可定義樹型區塊可分裂之最大次數,且亦可定義寫碼節點之最小大小。
CU包括一寫碼節點及與該寫碼節點相關聯之若干預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小且形狀為正方形。CU之大小的範圍可自8×8像素直至具有最大64×64像素或大於64×64像素之樹型區塊之大小。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。分割模式可視CU係經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼而不同。PU之形狀可分割成非正方形。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹至一或多個TU之分割。TU之形狀可為正方形或非正方形。
一般而言,PU包括與預測程序有關之資料。舉例而言,當將該PU以框內模式編碼時,該PU可包括描述該PU的框內預測模式之資料。作為另一實例,當將該PU以框間模式編碼時,該PU可包括定義該PU的運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
一般而言,TU係用於變換程序及量化程序。具有一或多個PU之CU亦可包括一或多個變換單元(TU)。在預測之後,視訊編碼器20可計算對應於PU之殘餘值。殘餘值包含視訊資料之當前區塊與視訊資料的預測性區塊之間的像素差值。殘餘值可變換成變換係數、經量化且使用TU掃描以產生串行化變換係數以用於熵寫碼。本發明通常使用術語「視訊區塊」來指代CU之寫碼節點。在一些特定狀況下,本發明亦可使用術語「視訊區塊」來指代包括一寫碼節點及若干PU及TU的樹型區塊(亦即,LCU或CU)。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)通常包含一系列視訊圖像中之一或多者。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括描述包括於GOP中之圖像數目的語法資料。圖像之每一切片可包括描述該各別切片之編碼模式的切片語法資料。視訊編碼器20通常對個別視訊切片內之視訊區塊進行操作,以便對視訊資料進行編碼。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小方面不同。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小進行框間預測之不對稱分割。在不對稱分割中,CU之一方向未分割,而另一方向分割成25%及75%。CU之對應於25%分割之部分由「n」繼之以「上(U)」、「下(D)」、「左(L)」或「右(R)」之指示來指示。因此,例如,「2N×nU」指代在水平方向上以頂部2N×0.5N PU及底部2N×1.5N PU分割之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。大體而言,16x16區塊在垂直方向中將具有16個像素(y=16)且在水平方向中將具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。可按列及行來配置區塊中之像素。另外,區塊不必需要在水平方向中與在垂直方向中具有相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M不必等於N。
在使用CU之PU的框內預測性或框間預測性寫碼之後,視訊編碼器20可計算殘餘資料。PU可包含空間域(亦稱作像素域)中之像素資料。TU可包含在應用變換(例如,離散餘弦變換(DCT)、整數變換、小波變換或與殘餘視訊資料概念上類似的變換)之後變換域中之係數。殘餘資料可對應於未經編碼圖像與預測性視訊區塊之像素之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在應用任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化一般指代如下程序:將變換係數量化以可能地減少用以表示該等係數之資料之量,從而提供進一步壓縮。該量化程序可減少與該等係數中之一些或所有相關聯的位元深度。舉例而言,可在量化期間將n位元值降值捨位至m位元值,其中n大於m。
在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數,以產生可經熵編碼的串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化變換係數以形成一維向量之後,視訊編碼器20可(例如)根據上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率間隔分割熵寫碼(PIPE)或另一熵編碼方法來對一維向量進行熵編碼。視訊編碼器20亦可熵編碼與經編碼之視訊資料相關聯的語法元素以供視訊解碼器30用於對視訊資料進行解碼。
為了執行CABAC,視訊編碼器20可將內容脈絡模型內之內容脈絡指派給待傳輸之符號。該內容脈絡可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可將VLC中之碼字建構成使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,使用VLC可達成位元節省(與(例如)針對待傳輸之每一符號使用等長度碼字相比較)。機率判定可基於指派給符號之上下文而進行。
圖2為說明可實施本發明中所描述之框間預測技術之實例視訊編碼器20的方塊圖。視訊編碼器20可執行視訊切片內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中之任一者。諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干基於時間之壓縮模式中之任一者。
在圖2之實例中,視訊編碼器20包括模式選擇單元40、預測模組41、參考圖像記憶體64、求和器50、變換模塊52、量化單元54及熵編碼單元56。預測模組41包括運動估計單元42、運動補償單元44及框內預測模組46。對於視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換模組60及求和器62。亦可包括一解區塊濾波器(圖2中未展示)用以對區塊邊界進行濾波,以自經重建構視訊移除成塊性假影。若需要,則該解區塊濾波器將通常對求和器62之輸出進行濾波。
如圖2中所展示,視訊編碼器20接收待編碼之視訊圖塊內之當前視訊區塊。可將該圖塊劃分成多個視訊區塊。模式選擇單元40可基於錯誤結果針對當前視訊區塊選擇寫碼模式(框內或框間)中之一者,且預測模組41可將所得經框內寫碼或經框間寫碼區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62以重建構經編碼區塊以用作參考圖像。
預測模組41內之框內預測模組46可執行相對於在與待寫碼之當前區塊相同的圖框或切片中之一或多個相鄰區塊的當前視訊區塊之框內預測性寫碼以提供空間壓縮。預測模組41內之運動估計單元42及運動補償單元44執行相對於一或多個參考圖像中之一或多個預測性區塊的當前視訊區塊之框間預測性寫碼以提供時間壓縮。
運動估計單元42可經組態以根據視訊序列之預定型樣判定視訊圖塊之框間預測模式。預定型樣可將序列中之視訊圖塊指定為P圖塊、B圖塊或GPB圖塊。移動估計單元42及移動補償單元44可高度整合,但為概念目的而分別說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。運動向量(例如)可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖像內之預測性區塊之移位。
預測性區塊為被發現與待寫碼之區塊在像素差方面緊密匹配之區塊,可藉由絕對差總和(SAD)、平方差總和(SSD)或其他不同量度來判定像素差。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中之參考圖像之次整數像素位置的值。舉例而言,視訊編碼器20可計算參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置之值。因此,運動估計單元42可執行相對於全像素位置及分率像素位置之運動搜尋,且以分率像素精度輸出運動向量。
運動估計單元42藉由比較框間寫碼切片中之視訊區塊的PU之位置與參考圖像之預測性區塊之位置而計算該PU之運動向量。參考圖像可自第一參考圖像清單(清單0)或第二參考圖像清單(清單1)選擇,該等清單中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將經計算運動向量發送至熵編碼單元56及運動補償單元44。
藉由運動補償單元44所執行之運動補償可涉及基於由運動估計所判定之運動向量提取或產生預測性區塊。在接收到當前視訊區塊之PU之運動向量時,運動補償單元44可將運動向量所指向的預測性區塊定位於參考圖像清單中之一者中。視訊編碼器20藉由自正寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。像素差值形成區塊之殘餘資料,且可包括明度差分量與色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊圖塊相關聯的供由視訊解碼器30用於對視訊圖塊之視訊區塊進行解碼的語法元素。
在運動補償單元44產生當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自該當前視訊區塊減去該預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且應用於變換模組52。變換模組52使用諸如離散餘弦變換(DCT)或概念上類似的變換之變換將殘餘視訊資料變換成殘餘變換係數。變換模組52可將殘餘視訊資料自像素域轉換至變換域,諸如頻域。
變換模組52可將所得變換係數發送至量化單元54。量化單元54對變換係數進行量化以進一步減小位元速率。該量化程序可減少與該等係數中之一些或所有相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56對經量化之變換係數進行熵編碼。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)或另一熵編碼技術。在藉由熵編碼單元56進行熵編碼之後,可將經編碼位元串流傳輸至視訊解碼器30或加以存檔以供稍後傳輸或藉由視訊解碼器30擷取。熵編碼單元56亦可熵編碼正寫碼之當前視訊切片的運動向量及其他語法元素。
反量化單元58及反變換模組60分別應用反量化及反變換,以在像素域中重建構殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊與參考圖像清單中之一者內的參考圖像中之一者之預測性區塊相加來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重建構之殘餘區塊以計算次整數像素值以供用於運動估計中。求和器62將經重建構之殘餘區塊添加至由運動補償單元44所產生之運動補償預測區塊,以產生參考區塊以供儲存於參考圖像記憶體64中。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖框或圖像中之區塊進行框間預測。本發明之關於圖2之視訊編碼器20的細節在下文中予以更詳細描述。
圖3為說明可實施本發明中所描述之框間預測技術之實例視訊解碼器30的方塊圖。在圖3之實例中,視訊解碼器30包括熵解碼單元80、預測模組81、反量化單元86、反變換單元88、求和器90及參考圖像記憶體92。預測模組81包括運動補償單元82及框內預測模組84。在一些實例中,視訊解碼器30可執行大體與關於來自圖2之視訊編碼器20所描述之編碼程序互反的解碼程序。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼之視訊圖塊之視訊區塊及關聯之語法元素的經編碼之視訊位元串流。視訊解碼器30之熵解碼單元80對該位元串流進行熵解碼以產生經量化之係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測單元81。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級處接收語法元素。
在視訊切片經寫碼為經框內寫碼(I)切片時,預測模組81之框內預測模組84可基於用信號表示之框內預測模式及來自當前圖框或圖像的先前解碼區塊之資料而產生針對當前視訊切片之視訊區塊的預測資料。在視訊圖框經寫碼為經框間寫碼(亦即,B、P或GPB)切片時,預測模組81之運動補償單元82基於運動向量及自熵解碼單元80所接收的其他語法元素而產生針對當前視訊切片之視訊區塊的預測性區塊。預測性區塊可自參考圖像清單中之一者內的參考圖像中之一者產生。視訊解碼器30可基於儲存於參考圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單,清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素而判定當前視訊切片之視訊區塊之預測資訊,且使用該預測資訊以產生正經解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元82使用一些所接收之語法元素以判定用以對視訊切片之視訊區塊進行寫碼之預測模式(例如,框內預測或框間預測)、框間預測切片類型(例如,B切片、P切片或GPB切片)、切片之參考圖像清單中之一或多者的建構資訊、切片之每一框間寫碼視訊區塊之運動向量、切片之每一框間寫碼視訊區塊之框間預測狀態,及用以對當前視訊切片中之視訊區塊進行解碼之其他資訊。
運動補償單元82亦可基於內插濾波器執行內插。運動補償單元82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。運動補償單元82可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。
反量化單元86將位元串流中所提供且由熵解碼單元80解碼的經量化之變換係數反量化(亦即,解量化)。反量化程序可包括使用由視訊編碼器20所計算之視訊切片中之每一視訊區塊的量化參數,以判定量化程度及(同樣)應應用之反量化的程度。反變換模組88將反變換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。
在運動補償單元82基於運動向量及其他語法元素產生針對當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自反變換模組88之殘餘區塊與藉由運動補償單元82產生之對應預測性區塊加總來形成經解碼視訊區塊。求和器90表示執行此加總運算之一或多個組件。若需要,亦可應用去區塊濾波器來對經解碼區塊濾波以便移除成塊性假影。接著將給定圖框或圖像中之經解碼之視訊區塊儲存於參考圖像記憶體92中,參考圖像記憶體92儲存用於後續運動補償之參考圖像。參考圖像記憶體92亦儲存經解碼視訊以供稍後在顯示器件(諸如圖1之顯示器件32)上展示。本發明之關於圖3之視訊解碼器30之細節將在下文中予以更詳細描述。
如上文中參看圖2及圖3所論述,使用框間預測對PU進行寫碼涉及計算當前區塊與參考圖框中之區塊之間的運動向量。經由稱作運動估計(或運動搜尋)之程序(例如,藉由圖2之運動估計單元42)來計算運動向量。舉例而言,運動向量可指示在當前圖框中之預測單元相對於參考圖框之參考樣本之移位。參考區塊可為被發現在像素差方面與正經寫碼之區塊緊密匹配之區塊,可藉由絕對差總和(SAD)、平方差總和(SSD)或其他不同量度來判定像素差。參考區塊可出現在參考圖框或參考切片內之任何地方,但未必出現在參考圖框或參考切片之區塊(例如,寫碼單元)邊界。在一些實例中,參考區塊可出現在分率像素位置。在其他實例中,參考區塊可出現在相對於當前區塊而界定之參考圖像邊界外側。當發現與當前區塊最匹配之參考圖框之區塊時,編碼器(例如,圖2之運動估計單元42)可將當前部分之當前運動向量判定為參考圖框中自當前區塊至匹配區塊的位置差異(例如,自當前區塊之中心至匹配區塊之中心,或自當前區塊之左上角至匹配區塊之左上角)。
在一些實例中,編碼器(例如,圖2之預測模組41)可用信號表示經編碼之視訊位元串流中之每一區塊的運動向量。用信號表示之運動向量由解碼器使用以執行運動補償以便對視訊資料進行解碼。然而,用信號表示整個運動向量可能導致寫碼效率較低,因為運動向量通常由大量位元來表示。
在一些實例中,編碼器(例如,圖2之預測模組41)可預測每一分割(亦即,每一PU)之運動向量,而非用信號表示整個運動向量。在執行此運動向量預測程序時,編碼器可將已判定為用於與當前區塊相同之圖框中之空間相鄰區塊之一組候選運動向量判定為當前區塊或已判定為用於另一參考圖框中之協同定位區塊之候選運動向量。編碼器可執行運動向量預測而非用信號表示整個運動向量,以降低發信號之複雜性及位元速率。來自空間相鄰區塊之候選運動向量可稱作空間MVP候選,而來自另一參考圖框中之協同定位區塊之候選運動向量可稱作時間MVP候選。
針對HEVC標準已提出兩種不同模式之運動向量預測。一種模式稱作「合併」模式。而另一種模式稱作自適應性運動向量預測(AMVP)。在合併模式中,編碼器經由預測語法之位元串流發信號來指示解碼器自圖框之當前區塊的所判定候選運動向量複製運動向量、參考索引(在給定參考圖像清單中識別運動向量所指向之參考圖框)及運動預測方向(其識別參考圖像清單(清單0或清單1),亦即,按照參考圖框在時間上領先或是後繼於當前圖框)。此操作藉由在位元串流中用信號表示識別具有所判定候選運動向量之候選區塊(亦即,特定之空間MVP候選或時間MVP候選)之索引來完成。
因此,對於合併模式,預測語法可包括識別該模式(在該種狀況下為「合併」模式)之旗標及識別所判定候選區塊之位置的索引。在一些實例中,候選區塊將為關於當前區塊之因果性區塊。亦即,候選區塊將已被寫碼。因此,編碼器或解碼器已經接收及/或判定了候選區塊之運動向量、參考索引及運動預測方向。由此,對解碼而言,解碼器可僅僅自記憶體擷取與候選區塊相關聯之運動向量、參考索引及運動預測方向且為當前區塊複製此等值。為了在合併模式中解碼區塊,解碼器獲得預測符區塊,並將殘餘資料添加至預測符區塊以重建構經寫碼區塊。
在AMVP模式中,編碼器經由位元串流發信號指示解碼器僅自候選部分複製運動向量,並將參考圖框及預測方向分別發信號。在AMVP中,可藉由發送運動向量差(MVD)來用信號表示待複製之運動向量。MVD為當前區塊之當前運動向量與候選區塊之候選運動向量之間的差異。在此情況下,編碼器使用運動估計判定待寫碼之區塊之實際運動向量,且接著將實際運動向量與運動向量預測符之間的差異判定為MVD值。以此方式,解碼器並不需要使用針對當前運動向量之候選運動向量之精確複製(正如在合併模式中一樣),但卻可使用值與自運動估計所判定之當前實際運動向量「接近」之候選運動向量並藉由添加MVD以再生當前運動向量。此外,解碼器添加相應殘餘資料以重建構經寫碼區塊。
在大多數情況下,MVD需要比整個當前運動向量少之位元來進行發信號。由此,AVMP經由發送整體運動向量而在改良寫碼效率的同時允許當前運動向量之更精確發信號。相比之下,合併模式並不允許指定MVD,且由此,合併模式為了提高發信號效率(亦即,更少之位元)而犧牲了運動向量發信號之精確度。AVMP之預測語法可包括該模式(在此情況下為AMVP)之旗標、候選區塊之索引、候選區塊之當前運動向量與候選運動向量之間的MVD、參考索引及運動預測方向。
圖4A係說明對於自適應性運動向量預測模式,藉以判定運動向量預測符候選之空間及時間相鄰視訊區塊的概念圖。圖4B係說明對於合併模式,藉以判定運動向量預測符候選之空間及時間相鄰視訊區塊的概念圖。在任一模式中,視訊編碼器20(例如,圖2之預測模組41)及視訊解碼器30(例如,圖3之預測模組81)中之每一者判定同一運動向量預測符候選清單以自其判定當前PU 94或95之運動向量。AMVP模式下之運動向量預測符候選可包括當前PU 94之空間相鄰區塊之運動向量。例如,圖4A中所說明之相鄰區塊A、B、C、D及E。合併模式下之運動向量預測符候選可包括當前PU 95之空間相鄰區塊之運動向量。例如,圖4A中所說明之相鄰區塊A'、B'、C'及D'。運動向量預測符候選亦可包括當前PU 94之並列區塊96或當前PU 95之並列區塊97之時間相鄰區塊的運動向量。例如圖4A及圖4B中所說明之相鄰區塊T1、T2、T'1及T'2。運動向量預測符候選區塊之其他組態可用於每一模式。在一些情況下,運動向量預測符候選可包括兩個或兩個以上相鄰區塊之運動向量的組合,例如,該兩個或兩個以上之相鄰區塊的平均值、中位值或加權平均值。
在AMVP模式之情況下,可判定運動向量預測符候選清單包括空間或時間相鄰區塊之運動向量。接著視訊編碼器20自候選清單判定當前PU 94之最精確運動向量預測符候選。在一實例中,視訊編碼器20可將自相鄰區塊中之一者之運動向量產生之運動向量預測符候選判定為當前PU 94之運動向量預測符。在另一實例中,視訊編碼器20可將自相鄰區塊中之兩者或更多者之運動向量產生之運動向量預測符候選判定為當前PU 94之運動向量預測符。在此情況下,可將運動向量預測符計算為兩個或兩個以上運動向量之平均值、中位值或加權平均值。視訊編碼器20接著判定運動向量預測符與當前PU 94之運動向量之間的運動向量差。視訊編碼器20接著將運動向量差及當前PU 94之運動向量預測符索引發信號至視訊解碼器30。
視訊編碼器30接收表示包括運動向量差及視訊區塊之運動向量預測符索引之經編碼視訊區塊的位元串流。為了對視訊區塊進行解碼,視訊解碼30以與視訊編碼器20相同之方式產生運動向量預測符候選清單。視訊解碼器30藉由將當前PU 94之經發信號之運動向量預測符索引應用於候選清單來判定當前PU 94運動向量預測符。接著視訊解碼器30將經發信號之運動向量差與已判定之運動向量預測符組合以重建構當前PU 94之運動向量。視訊解碼器30使用當前PU 94之運動向量來將預測性區塊定位於參考圖像中以重建構經編碼視訊區塊。
在合併模式之情況下,可產生運動向量預測符候選清單以包括空間或時間相鄰區塊中之每一者之全部運動資訊(包括運動向量、參考圖像索引及預測方向)。接著視訊編碼器20自候選清單中之相鄰區塊判定當前PU 95之最精確運動資訊。代替將當前PU 95之運動向量差、參考圖像索引及預測方向發信號至視訊解碼器30,視訊編碼器20直接將相鄰區塊之已判定之運動資訊用作當前PU 95之最終運動資訊。以此方式,視訊編碼器20僅將用以指示藉以得出當前PU 95之全部運動資訊之相鄰區塊的索引發信號至視訊解碼器30。
視訊解碼器30接收表示包括視訊區塊之索引值的位元串流。為了對視訊區塊進行解碼,視訊解碼器30以與視訊編碼器20相同之方式判定一運動向量預測符候選清單。視訊解碼器30藉由將經發信號之索引應用於候選清單來判定當前PU 95之全部運動資訊(包括運動向量、參考圖像索引及預測方向)以判定相鄰區塊之運動資訊。接著視訊解碼器30使用當前PU 95之運動向量來定位預測性區塊以重建構經編碼視訊區塊。
圖5為說明參考圖像100及藉由當前PU或視訊區塊94之運動向量預測符候選而定位於參考圖像邊界102外側之預測區塊106及108的概念圖。當前在合併模式或AMVP模式下,可剪取識別相對於當前PU 94位於參考圖像邊界102外側之預測區塊(例如106或108)的運動向量預測符候選以將預測區塊重定位於填補區域104內。參考圖像邊界102經判定為最小CU大小之倍數。舉例而言,若最小CU大小為8×8,且待寫碼區域為33×33,則將該圖像寫碼為具有33×33裁切區域之40×40區域。通常並未為解碼器界定該裁切區域。解碼器可解碼為最小CU大小之某一倍數的區域。為運動補償而發生之填補藉由在40×40區域將像素有效複製至無窮大而自40×40區域之邊界開始。本發明之技術消除了對運動向量預測符候選之剪取。
作為一實例,當前PU 94之相鄰區塊(例如,來自圖4A之區塊E)可具有指向位於相關聯之參考圖像100之右下邊緣之預測區塊(未在圖5中展示)的運動向量。當應用於當前PU 94時,運動向量預測符候選具有與相鄰區塊相同之尺寸及方向,但是其中一起點平移至當前PU 94之左上角。如圖4A中所圖示,與相鄰區塊E相比,當前PU 94定位於更靠右邊。因此,相對於當前PU 94,運動向量預測符候選可指向位於參考圖像邊界102外側之預測性區塊108。換言之,運動向量預測符候選相對於當前PU 94之「起始」移位以使得運動向量預測符候選之「末端」可指向參考圖像邊界102外之一區域。
傳統上,可將關於當前視訊區塊94而判定之運動向量剪取為若干值以使得整個預測區塊包括於參考圖像邊界102內。剪取程序用以在運動補償之前有效地剪取運動向量值以便基於預測區塊之像素值來判定當前視訊區塊之殘餘資料。為了判定預測區塊之像素值,預測區塊較佳位於參考圖像100內或至少位於填補區域104內。
一般而言,較佳藉由某一組值來表示參考圖像邊界102以外之區域。參考圖像邊界102以外之區域並非為一空白(亦即,並非零值)。實情為,在大多數情形下,參考圖像邊界以外之區域係對應於相鄰參考圖像之像素值。一相鄰參考圖像可能並非可用,因為還未曾對其進行編碼/解碼,或參考圖像之值可能未被儲存於記憶體中。因而,視訊解碼器30可藉由自參考圖像100之邊緣複製像素值來產生填補區域104。可將圖像邊緣處之值用於重複性填補。理論上,填補區域大小係無限的。實際上,視訊寫碼器將經組態以按最大預測單元大小來進行填補。附加填補可用於內插濾波器。如圖5中所示之填補區域104可具有與最大區塊(例如,樹型區塊或LCU)之寬度相等之寬度。然而,視訊解碼器30可使用重複像素值來產生填補區域以具有任何大小。
在當前HM中,對於合併模式及AMVP模式,剪取程序在用於運動向量預測之前亦可用以有效地剪取當前PU 94及/或95之運動向量預測符候選。剪取已判定之運動向量預測符候選以確保相對於當前PU 94定位之整個預測區塊(例如106或108)包括有參考圖像邊界102內。用以確保預測區塊處於參考圖像邊界102內之剪取程序為了空間及時間運動向量預測符候選兩者而發生。
剪取操作以以下演算法而實施。
本演算法中之變數之定義如下:m_pcSlice->getSPS( )->getWidth( ):像素中之圖像寬度
m_pcSlice->getSPS( )->getHeight( ):像素中之圖像高度
g_uiMaxCUWidth:像素中之最大CU寬度
g_uiMaxCUHeight:像素中之最大CU高度
m_uiCUPelX:像素中之LCU內的CU水平位址
m_uiCUPelY:像素中之LCU內的CU垂直位址
rcMv.getHor( ):四分之一像素單元中之水平運動向量
rcMv.getVer( ):四分之一像素單元中之垂直運動向量
可剪取運動向量預測符候選以將所識別之預測區塊106及108移位以至少位於填補區域104內。如圖5中所圖示,可剪取運動向量預測符候選以將預測區塊106及108重定位以至少完全位於圍繞參考圖像100之填補區域104內,但未必位於參考圖像邊界102內。當運動向量預測符候選將預測區塊定位於參考圖像邊界102內或者參考圖像邊界102外,但仍然完全位於填補區域104內時,運動向量預測符候選保持未剪取。
在關於HEVC之一提議中,當運動向量預測符候選指向位於參考圖像邊界102外側之預測區塊(例如,預測區塊106及108)時,視訊解碼器30及/或視訊編碼器20剪取運動向量預測符候選以將預測區塊106及108重定位於填補區域104內。舉例而言,視訊解碼器30可剪取運動向量預測符候選以使得預測區塊108之左上角將移動至位置109,從而確保預測區塊108完全位於填補區域104內。類似地,視訊解碼器30可剪取運動向量預測符候選以使得預測區塊106之左上角將移動至位置107,從而確保預測區塊106完全位於填補區域104內。
當判定經剪取運動向量預測符候選以對當前視訊區塊進行編碼時,不同於未經剪取運動向量預測符候選之情況,需要將運動向量資訊發信號至視訊解碼器30。舉例而言,在AMVP模式之情況下,若相對於當前PU 94之運動向量預測符候選指向具有座標(-5,3)之預測區塊106而填補區域104僅延伸至-2之x座標,則將基於填補區域104之大小來剪取運動向量預測符候選以指向座標(-2,3),例如,位置107。若視訊編碼器20接著將經剪取運動向量預測符候選判定為亦具有指向座標(-5,3)之運動向量之當前PU 94的運動向量預測符,則視訊編碼器20必須用信號表示當前PU 94之運動向量與經剪取運動向量預測符之間的運動向量差-3。若運動向量預測符候選保持未剪取,則視訊編碼器20可將運動向量差作為差量0而發信號。
根據本發明之技術,運動向量預測符候選清單產生程序中消除了運動向量預測符候選剪取程序。具體而言,當相對於當前PU 94之運動向量預測符候選指向參考圖像邊界102外之預測區塊(例如,106或108)時,視訊編碼器20及/或視訊解碼器30將不會剪取或以其他方式截斷運動向量預測符候選。實情為,未經剪取版本之運動向量預測符候選將包括於運動向量預測符候選清單中。該等技術可在判定當前PU 94之運動向量預測符候選時,藉由並不調用上文中所陳述之剪取演算法來消除候選清單判定程序中之剪取程序。
若運動向量預測符候選指向相對於當前PU 94位於參考圖像邊界102外側之參考圖像,則視訊編碼器20及/或視訊解碼器30將不會在AMVP模式或合併模式中剪取當前PU 94或95之運動向量預測符候選。因而,AMVP模式候選清單(例如,針對圖4A之當前PU 94所展示之候選)及合併模式候選清單(例如,針對圖4B之當前PU 95所展示之候選)可由藉由合併模式及AMVP模式候選清單判定程序判定之未經剪取版本的運動向量預測符候選而形成。舉例而言,當判定運動向量預測符候選清單時,不考慮由相對於當前PU 94之運動向量預測符候選所識別之預測區塊(例如,預測區塊106或108)的位置,視訊編碼器20及/或視訊解碼器30包括未經剪取版本之運動向量預測符候選。
根據本發明之技術,在運動向量預測符候選產生程序期間,運動向量預測符候選皆不會被剪取。以此方式,視訊編碼器20及視訊解碼器30並不需要對包括於候選清單中之運動向量預測符候選中之每一者進行檢查以判定是否需要剪取特定運動向量預測符候選。在關於HEVC之一提議中,視訊編碼器20及視訊解碼器30可能需要檢查每一待編碼視訊區塊之所有運動向量預測符候選,例如,5-10個候選。由此,需要剪取之候選運動向量可能多達5-10個。因而,藉由消除運動向量預測符候選產生程序中之剪取程序,本發明之技術降低了視訊編碼器20及視訊解碼器30之複雜度。
另外,根據該等技術,可基於已判定之未經剪取運動向量預測符候選來對當前PU 94或95進行寫碼。舉例而言,在AMVP模式之情況下,視訊編碼器20自候選清單判定當前PU 94之最精確的未經剪取運動向量預測符候選。視訊編碼器20接著將當前PU 94之運動向量差及一運動向量預測符索引發信號至視訊解碼器30。視訊解碼器30接收表示包括視訊區塊之運動向量差及運動向量預測符索引之經編碼視訊區塊的位元串流。視訊解碼器30藉由將當前PU 94之經發信號之運動向量預測符索引應用至候選清單來判定當前PU 94之未經剪取運動向量預測符候選。視訊解碼器30接著將經發信號之運動向量差與已判定之未經剪取運動向量預測符候選組合以重建構當前PU 94之運動向量。視訊解碼器30使用當前PU 94之運動向量來將預測性區塊定位於參考圖像中,從而重建構經編碼之視訊區塊。
作為另一實例,在合併模式之情況下,視訊編碼器20自候選清單中之相鄰區塊判定當前PU 95之最精確運動資訊(包括未經剪取運動向量預測符候選)。視訊編碼器20用信號表示一索引以向視訊解碼器30指示藉以得出當前PU 95之全部運動資訊之相鄰區塊。視訊解碼器30接收表示包括視訊區塊之索引值之經編碼視訊區塊的位元串流。視訊解碼器30藉由將經發信號之索引應用於候選清單來判定當前PU 95之全部運動資訊(包括未經剪取運動向量預測符候選)。視訊解碼器30接著判定當前PU 95之運動向量與已判定之未經剪取運動向量預測符候選相等。視訊解碼器30接著使用當前PU 95之運動向量來定位預測性區塊以重建構經編碼之視訊區塊。
在一些情況下,基於已判定之未經剪取運動向量預測符候選針對當前PU 94或95而判定之運動向量可在參考圖像邊界之外。接著可在運動補償期間剪取此未經剪取運動向量。由此,本發明之技術防止了在運動向量預測候選判定程序期間對運動向量候選之不必要剪取,然而,若該等運動向量候選實際係用於運動補償,則其僅剪取參考圖像邊界之外的運動向量。
舉例而言,當在不剪取之情況下使用合併模式或AMVP模式之運動向量預測符候選時,自運動向量預測符候選所判定之當前PU 94或95的運動向量可指向在參考圖像邊界102外側之預測區塊。然而,藉由填補程序及/或剪取程序來在運動補償期間對此問題加以處置。更具體而言,當已判定之運動向量指向位於參考圖像邊界102外側之預測區塊時,視訊編碼器20或視訊解碼器30可擴展填補區域104以包括預測性區塊,或可剪取已判定之運動向量以將預測區塊重定位於填補區域104內。在任一情況下,用以重建構經編碼視訊區塊之經識別之預測區塊將包括填補區域值,亦即自參考圖像102之邊緣重複之像素值。
使用針對合併模式及AMVP模式之未經剪取運動向量預測符候選在降低視訊編碼器20及視訊解碼器30之複雜度的同時,並不改變運動補償程序。根據本發明之技術,消除了運動向量預測符候選清單判定程序中之剪取程序,以使得運動向量預測符候選保持未剪取。然而,若在運動補償期間用以預測像素值之預測區塊超出參考圖像邊界102,則在運動補償期間仍可剪取自已判定之未經剪取運動向量預測符候選所判定之當前PU 94或95的運動向量。以此方式,視訊編碼器20或視訊解碼器30仍重定位預測區塊以位於參考圖像邊界102內填補區域104內而不必剪取包括於候選清單中之全部運動向量預測符候選。
舉例而言,在AMVP模式之情況下,視訊解碼器30藉由將當前PU 94之經發信號之運動向量預測索引應用於候選清單來判定當前PU 94之未經剪取運動向量預測符候選。已判定之未經剪取運動向量預測符候選可指示相對於當前PU 94位於參考圖像邊界102外側之預測區塊。在一些情況下,經發信號之運動向量差(當與已判定之未經剪取運動向量預測符候選組合以判定當前PU 94之運動向量時)將使預測區塊處於參考圖像邊界102內。在其他情況下,當前PU 94之已判定之運動向量仍將指示位於參考圖像邊界102(其需要附加填補或剪取)外側之預測區塊。
作為另一實例,在合併模式之情況下,視訊解碼器30藉由將經發信號之索引應用於候選清單來判定當前PU 96之全部運動資訊(包括未經剪取運動向量預測符候選)。已判定之未經剪取運動向量預測符候選可指示相對於當前PU 96位於參考圖像邊界102外側之預測區塊。在合併模式中,視訊解碼器30判定當前PU 96之運動向量與已判定之未經剪取運動向量預測符候選相等。因而,當前PU 96之已判定之運動向量仍將指示位於參考圖像邊界102之預測區塊,該參考圖像邊界102需要附加填補或剪取。
圖6係使用本發明之技術來對視訊進行編碼之方法的實例流程圖。視訊編碼器20可例如使用如上文中所描述之運動估計程序來初始計算視訊區塊之當前預測單元之運動向量(120)。接著,視訊編碼器20判定未剪取運動向量之運動向量預測符候選(122)。如上文所描述,可取決於正使用之運動向量預測程序之類型(例如,AMVP或合併模式)來產生不同運動向量預測符候選清單。舉例而言,對於AMVP模式,來自PU 94之圖4A中所示之相鄰區塊的運動向量可包括於PU 94之運動向量預測符候選清單中,而對於合併模式,來自PU 95之圖4B中所示之相鄰區塊之運動向量可包括於PU 95之運動向量預測符候選清單中。
基於所計算之運動向量,視訊編碼器20接著自運動向量候選清單判定未經剪取運動向量(124)。已判定之候選運動向量保持未剪取,而無論其指向相對於當前經寫碼PU處於圖像邊緣內側或是外側之參考區塊。接著,視訊編碼器20對索引進行編碼以識別已判定之未經剪取運動向量候選(126)。在合併模式中,僅編碼已判定之未經剪取運動向量候選之索引,此係因為亦自已判定之候選運動向量複製了運動資訊而非運動向量(例如,參考圖框索引、預測方向)。在AMVP模式中,亦可對附加運動資訊進行編碼,包括運動向量差(亦即,經計算之運動向量與已判定之未經剪取運動向量之間的差異)、參考圖框索引及預測方向。視訊編碼器20可在運動補償程序期間剪取實際用於運動補償之任何已判定之運動向量。
圖7係使用本發明之技術來對視訊進行解碼之方法的實例流程圖。首先,視訊解碼器30接收指示運動資訊之語法元素(140)。若正解碼之特定視訊區塊正於合併模式下操作,則指示運動資訊之語法元素可包括識別來自運動向量候選清單之特定運動向量候選的索引。此外,正使用之特定運動向量候選清單可取決於正使用之運動向量預測模式(例如,AMVP或合併模式)。若正解碼之特定視訊區塊正於AMVP模式下操作,則指示運動資訊之語法元素可包括識別來自運動向量候選清單之特定運動向量候選、預定向量差、參考圖框索引及預測方向之索引。
接著,視訊解碼器30在不剪取運動向量的情況下判定運動向量預測符候選清單(142)。再次,如同視訊解碼器20,所使用之特定候選清單可取決於正使用之運動向量預測程序。無論該等運動向量指向相對於當前正解碼之視訊區塊位於參考圖像邊界內側或是外側之參考區塊,皆不剪取運動向量候選清單中之運動向量。基於所接收之語法元素,視訊解碼器30自運動向量候選清單判定一未經剪取運動向量(144)。若所判定之特定運動向量正好指向相對於正解碼之當前視訊區塊位於參考圖像邊界外側之參考圖像,則視訊解碼器30接著可剪取供在運動補償程序期間使用之已判定之運動向量(146)。在此情況下,對運動向量之剪取為非標準化程序,此係因為填補在理論上是無窮的且若填補充足則剪取可能並非必要。此處提及之剪取程序僅影響運動補償程序。亦即,經剪取運動向量僅用於運動補償,且不應用於進一步運動向量導出等。以此方式,改為僅剪取指向參考圖片邊界之外的實際使用之參考圖片的運動向量或剪取參考圖像邊界外側之全部運動向量預測候選。
接著視訊解碼器30使用運動補償程序來解碼使用經剪取運動向量(若已判定之運動向量位於參考圖像邊界外側)或未經剪取運動向量(若已判定之運動向量並不在參考圖像邊界之外)的當前視訊區塊(148)。在合併模式中,直接從自所接收之運動向量資訊語法元素判定之運動向量候選複製用於運動補償之運動向量、參考圖框及預測方向。在AMVP中,將參考圖框及預測方向在所接收之運動資訊語法元素中明確指出。藉由將所接收之運動向量差與所判定運動向量相加來計算用於運動補償之運動向量。
在一或多個實例中,所描述之功能可在硬體、軟體、韌體或其任何組合中實施。若在軟體中實施,則功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體,通信媒體包括(例如)根據通信協定促進電腦程式自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括一電腦可讀媒體。
作為實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之其他任何媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是有關非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路之一或多個處理器來執行指令。因此,本文中所使用之術語「處理器」可指代上述結構或適於實施本文中所描述之技術的其他任何結構中之任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可以多種器件或裝置予以實施,該等器件或裝置包括無線手機、積體電路(IC)或IC集合(例如,晶片集)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術的器件之功能態樣,但未必要求藉由不同硬體單元來實現。而是,如上文所描述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合且結合適宜軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例屬於以下申請專利範圍之範疇內。
10‧‧‧實例視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧鏈路
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧數據機
24‧‧‧傳輸器
26‧‧‧接收器
28‧‧‧數據機
30‧‧‧視訊解碼器
32‧‧‧顯示器件
34‧‧‧儲存媒體
36‧‧‧檔案伺服器
40‧‧‧模式選擇單元
41‧‧‧預測模組
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測模組
50‧‧‧求和器
52‧‧‧變換模組
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換模組
62‧‧‧求和器
64‧‧‧參考圖像記憶體
80‧‧‧熵解碼單元
81‧‧‧預測模組
82‧‧‧運動補償單元
84‧‧‧框內預測模組
86‧‧‧反量化單元
88‧‧‧反變換單元
90‧‧‧求和器
92‧‧‧參考圖像記憶體
94‧‧‧當前PU
95‧‧‧當前PU
96‧‧‧合併區塊
97‧‧‧合併區塊
100‧‧‧參考圖像
102‧‧‧參考圖像邊界
104‧‧‧填補區域
106‧‧‧預測區塊
107‧‧‧位置
108‧‧‧預測區塊
109‧‧‧位置
圖1係說明可利用本發明中所描述之技術之實例視訊編碼及解碼系統之方塊圖。
圖2係說明可實施本發明中所描述之技術之實例視訊編碼器之方塊圖。
圖3係說明可實施本發明中所描述之技術之實例視訊解碼器之方塊圖。
圖4A係說明對於自適應性運動向量預測模式,藉以判定運動向量預測符候選之空間及時間相鄰視訊區塊的概念圖。
圖4B係說明對於合併模式,藉以判定運動向量預測符候選之空間及時間相鄰視訊區塊的概念圖。
圖5係說明參考圖像及藉由當前視訊區塊之運動向量預測符候選而定位於參考圖像邊界外側之預測區塊的概念圖。
圖6係使用本發明之技術來對視訊進行編碼之方法的實例流程圖。
圖7係使用本發明之技術來對視訊進行解碼之方法的實例流程圖。
权利要求:
Claims (36)
[1] 一種用於對視訊資料進行寫碼之方法,其包含:在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中;及基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊寫碼。
[2] 如請求項1之方法,其中對該當前視訊區塊進行寫碼包含對一索引進行編碼以識別該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選。
[3] 如請求項1之方法,其中對該當前視訊區塊進行寫碼包含對該視訊區塊進行解碼,該方法進一步包含:基於該當前視訊區塊之該已判定之未經剪取運動向量預測符候選來判定該當前視訊區塊之一運動向量;在該已判定之運動向量識別出相對於該當前視訊區塊位於一參考圖像邊界外側的一預測區塊之情況下,剪取該已判定之運動向量以將該預測區塊重定位於圍繞該參考圖像之一填補區域內;及相對於該經重定位預測區塊對該當前視訊區塊進行解碼,其中該經重定位預測區塊包括填補區域值。
[4] 如請求項3之方法,其中該經重定位預測區塊之該等填補區域值包含來自該參考圖像之邊緣的重複像素值。
[5] 如請求項1之方法,其中對該視訊區塊進行寫碼包含根據運動向量預測之一自適應性運動向量預測(AMVP)模式來對該視訊區塊進行解碼,該方法進一步包含:對一運動向量預測符索引進行解碼以識別該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選;對該已判定之未經剪取運動向量預測符與該當前視訊區塊之一運動向量之間的一運動向量差進行解碼以判定該當前視訊區塊之該運動向量;及使用該已判定之運動向量來對該當前視訊區塊進行解碼。
[6] 如請求項1之方法,其中對該視訊區塊進行寫碼包含根據運動向量預測之一合併模式來對該視訊區塊進行解碼,該方法進一步包含:對一索引進行解碼以識別包括該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選的運動資訊;判定該當前視訊區塊之一運動向量與該已判定之未經剪取運動向量預測符候選相等;及使用該已判定之運動向量來對該當前視訊區塊進行解碼。
[7] 如請求項1之方法,其中相鄰視訊區塊包含該當前視訊區塊之空間相鄰視訊區塊及該當前視訊區塊之一並列區塊的時間相鄰視訊區塊中的一或多者。
[8] 如請求項1之方法,其中對該當前視訊區塊進行寫碼包含基於該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行編碼,及對一索引進行編碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選。
[9] 如請求項1之方法,其中對該當前視訊區塊進行寫碼包含對一索引進行解碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選,及基於該候選清單之該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行解碼。
[10] 一種經組態以對視訊資料進行寫碼之裝置,其包含:用於在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單之構件,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中;及用於基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼之構件。
[11] 如請求項10之裝置,其中該用於對該當前視訊區塊進行寫碼之構件包含用於對一索引進行編碼以識別該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選之構件。
[12] 如請求項10之裝置,其中該用於對該當前視訊區塊進行寫碼之構件包含用於對該視訊區塊進行解碼之構件,該裝置進一步包含:用於基於該當前視訊區塊之該已判定之未經剪取運動向量預測符候選來判定該當前視訊區塊之一運動向量之構件;用於在該已判定之運動向量識別出相對於該當前視訊區塊位於一參考圖像邊界外側的一預測區塊的情況下,剪取該已判定之運動向量以將該預測區塊重定位於圍繞該參考圖像之一填補區域內之構件;及用於相對於該經重定位預測區塊對該當前視訊區塊進行解碼之構件,其中該經重定位預測區塊包括填補區域值。
[13] 如請求項12之裝置,其中該經重定位預測區塊之該等填補區域值包含來自該參考圖像之邊緣的重複像素值。
[14] 如請求項10之裝置,其中該用於對該視訊區塊進行寫碼之構件包含用於根據運動向量預測之一自適應性運動向量預測(AMVP)模式來對該視訊區塊進行解碼之構件,該裝置進一步包含:用於對一運動向量預測符索引進行解碼以識別該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選之構件;用於對該已判定之未經剪取運動向量預測符與該當前視訊區塊之一運動向量之間的一運動向量差進行解碼以判定該當前視訊區塊之該運動向量之構件;及用於使用該已判定之運動向量來對該當前視訊區塊進行解碼之構件。
[15] 如請求項10之裝置,其中該用於對該視訊區塊進行寫碼之構件包含用於根據運動向量預測之一合併模式對該視訊區塊進行解碼之構件,該裝置進一步包含:用於對一索引進行解碼以識別包括該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選之運動資訊之構件;用於判定該當前視訊區塊之一運動向量與該已判定之未經剪取運動向量預測符候選相等之構件;及用於使用該已判定之運動向量對該當前視訊區塊進行解碼之構件。
[16] 如請求項10之裝置,其中相鄰視訊區塊包含該當前視訊區塊之空間相鄰視訊區塊及該當前視訊區塊之一並列區塊之時間相鄰視訊區塊中的一或多者。
[17] 如請求項10之裝置,其中用於對該當前視訊區塊進行寫碼之構件包含用於基於該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行編碼之構件,及用於對一索引進行編碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選之構件。
[18] 如請求項10之裝置,其中用於對該當前視訊區塊進行寫碼之構件包含用於對一索引進行解碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選之構件,及用於基於該候選清單之該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行解碼之構件。
[19] 一種經組態以對視訊資料進行寫碼之裝置,其包含:一視訊寫碼器,其經組態以:在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中;及基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。
[20] 如請求項19之裝置,其中該視訊寫碼器為一視訊編碼器,且其中該視訊編碼器經組態以對一索引進行編碼以識別該候選清單中之該當前視訊區塊之該已判定之未經剪取運動向量預測符候選。
[21] 如請求項19之裝置,其中該視訊寫碼器為一視訊解碼器,且其中該視訊解碼器經組態以:基於該當前視訊區塊之該已判定之未經剪取運動向量預測符候選來判定該當前視訊區塊之一運動向量;在該已判定之運動向量識別出相對於該當前視訊區塊位於一參考圖像邊界外側的一預測區塊的情況下,剪取該已判定之運動向量以將該預測區塊重定位於圍繞該參考圖像之一填補區域內;及相對於該經重定位預測區塊對該當前視訊區塊進行解碼,其中該經重定位預測區塊包括填補區域值。
[22] 如請求項21之裝置,其中該經重定位預測區塊之該等填補區域值包含來自該參考圖像之邊緣的重複像素值。
[23] 如請求項19之裝置,其中該視訊寫碼器為一視訊解碼器,該視訊解碼器經組態以根據運動向量預測之一自適應性運動向量預測(AMVP)模式來對該視訊區塊進行解碼,該視訊解碼器進一步經組態以:對一運動向量預測符索引進行解碼以識別該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選;對該已判定之未經剪取運動向量預測符與該當前視訊區塊之一運動向量之間的一運動向量差進行解碼以判定該當前視訊區塊之該運動向量;及使用該已判定之運動向量來對該當前視訊區塊進行解碼。
[24] 如請求項19之裝置,其中該視訊寫碼器為一視訊解碼器,該視訊解碼器經組態以根據運動向量預測之一合併模式來對該視訊區塊進行解碼,該視訊解碼器進一步經組態以:對一索引進行解碼以識別包括該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選的運動資訊;判定該當前視訊區塊之一運動向量與該已判定之未經剪取運動向量預測符候選相等;及使用該已判定之運動向量來對該當前視訊區塊進行解碼。
[25] 如請求項19之裝置,其中相鄰視訊區塊包含該當前視訊區塊之空間相鄰視訊區塊及該當前視訊區塊之一並列區塊之時間相鄰視訊區塊中的一或多者。
[26] 如請求項19之裝置,其中該視訊寫碼器為一視訊編碼器,且其中該視訊編碼器經組態以基於該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行編碼,及對一索引進行編碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選。
[27] 如請求項19之裝置,其中該視訊寫碼器為一視訊解碼器,該視訊解碼器經組態以對一索引進行解碼從而識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選,及基於該候選清單之該已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行解碼。
[28] 一種儲存指令之電腦可讀媒體,該等指令用於使得經組態以對視訊資料進行寫碼之一處理器進行以下動作:在不剪取運動向量預測符候選的情況下自相鄰視訊區塊判定包括該等運動向量預測符候選之一運動向量預測符候選清單,其中若一運動向量預測符候選識別出相對於一當前視訊區塊位於一參考圖像邊界外側的一預測區塊,則將一未經剪取版本之該運動向量預測符候選包括於該候選清單中;及基於該候選清單之一已判定之未經剪取運動向量預測符候選來對該當前視訊區塊進行寫碼。
[29] 如請求項28之電腦可讀媒體,其中該等用於使得一處理器對該當前視訊區塊進行寫碼之指令包含用於使得一處理器對一索引進行編碼以識別該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選的指令。
[30] 如請求項28之電腦可讀媒體,其中用於使得一處理器對該當前視訊區塊進行寫碼之該等指令包含用於使得一處理器對該視訊區塊進行解碼之指令,該電腦可讀媒體進一步包含指令,該等指令用於使得一處理器:基於該當前視訊區塊之該已判定之未經剪取運動向量預測符候選來判定該當前視訊區塊之一運動向量;在該已判定之運動向量識別出相對於該當前視訊區塊位於一參考圖像邊界外側的一預測區塊的情況下,剪取該已判定之運動向量以將該預測區塊重定位於圍繞該參考圖像之一填補區域內;及相對於該經重定位預測區塊對該當前視訊區塊進行解碼,其中該經重定位預測區塊包括填補區域值。
[31] 如請求項30之電腦可讀媒體,其中該經重定位預測區塊之該等填補區域值包含來自該參考圖像之邊緣的重複像素值。
[32] 如請求項28之電腦可讀媒體,其中用於使得一處理器對該視訊區塊進行寫碼之該等指令包含用於使得一處理器根據運動向量預測之一自適應性運動向量預測(AMVP)模式來對該視訊區塊進行解碼之指令,該電腦可讀媒體進一步包含指令,該等指令用於使得一處理器:對一運動向量預測符索引進行解碼以識別該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選;對該已判定之未經剪取運動向量預測符與該當前視訊區塊之一運動向量之間的一運動向量差進行解碼以判定該當前視訊區塊之該運動向量;及使用該已判定之運動向量來對該當前視訊區塊進行解碼。
[33] 如請求項28之電腦可讀媒體,其中用於使得一處理器對該視訊區塊進行寫碼之該等指令包含用於使得一處理器根據運動向量預測之一合併模式來對該視訊區塊進行解碼之指令,該電腦可讀媒體進一步包含指令,該等指令用於使得一處理器:對一索引進行解碼以識別包括該候選清單中之該當前視訊區塊的該已判定之未經剪取運動向量預測符候選的運動資訊;判定該當前視訊區塊之一運動向量與該已判定之未經剪取運動向量預測符候選相等;及使用該已判定之運動向量對該當前視訊區塊進行解碼。
[34] 如請求項28之電腦可讀媒體,其中相鄰視訊區塊包含該當前視訊區塊之空間相鄰視訊區塊及該當前視訊區塊之一並列區塊之時間相鄰視訊區塊中的一或多者。
[35] 如請求項28之電腦可讀媒體,其中用於使得一處理器對該當前視訊區塊進行寫碼之該等指令包含用於使得一處理器基於該已判定之未經剪取運動向量預測符候選對該當前視訊區塊進行編碼,及對一索引進行編碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選之指令。
[36] 如請求項28之電腦可讀媒體,其中用於使得一處理器對該當前視訊區塊進行寫碼之該等指令包含用於使得一處理器對一索引進行解碼以識別該當前視訊區塊之該已判定之未經剪取運動向量預測符候選、及基於該候選清單之該已判定之未經剪取運動向量預測符候選對該當前視訊區塊進行解碼的指令。
类似技术:
公开号 | 公开日 | 专利标题
TWI528788B|2016-04-01|用於寫碼視訊資料之方法、裝置及電腦可讀媒體
JP6882560B2|2021-06-02|画像予測方法および装置
TWI688262B|2020-03-11|用於視訊寫碼之重疊運動補償
TWI719053B|2021-02-21|內區塊複製合併模式及不可用內區塊複製參考區域之填充
JP2018142972A|2018-09-13|Bスライス中の予測ユニットの単方向インター予測への制限
JP2018050308A|2018-03-29|ビデオコーディングのための動きベクトル予測の実行
US9736489B2|2017-08-15|Motion vector determination for video coding
US9167269B2|2015-10-20|Determining boundary strength values for deblocking filtering for video coding
JP5774780B2|2015-09-09|ビデオコーディングにおけるイントラ予測のための境界画素のパディング
JP6022586B2|2016-11-09|ビデオコーディングのための隣接するビデオユニットの利用可能性の検出
JP6231109B2|2017-11-15|コンテキスト適応型、マルチレベル有意性コーディングに関するコンテキスト導出
KR20140017020A|2014-02-10|일원화된 병합 모드 및 적응적 모션 벡터 예측 모드 후보 선택
TW201352004A|2013-12-16|轉換係數寫碼
WO2015031806A1|2015-03-05|Constrained intra prediction in video coding
JP2017519447A|2017-07-13|ビデオコーディングのためのイントラブロックコピーブロックベクトルシグナリング
TW201313028A|2013-03-16|在視訊寫碼中之係數掃描
KR20150076235A|2015-07-06|비디오 코딩을 위한 참조 화상 상태
TWI520584B|2016-02-01|用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素
TW201517599A|2015-05-01|內部運動補償延伸
US9420285B2|2016-08-16|Inter-layer mode derivation for prediction in scalable video coding
TW201444350A|2014-11-16|方形區塊預測
JP2018524906A|2018-08-30|イントラブロックコピーモードでの参照ピクチャリスト構成
CN113170141A|2021-07-23|帧间预测方法和相关装置
同族专利:
公开号 | 公开日
TWI528788B|2016-04-01|
CN103843347B|2017-04-19|
KR101622058B1|2016-05-31|
WO2013052244A1|2013-04-11|
CN103843347A|2014-06-04|
JP5823623B2|2015-11-25|
US20130083853A1|2013-04-04|
IN2014CN02202A|2015-06-12|
KR20140074377A|2014-06-17|
JP2014531873A|2014-11-27|
BR112014008097A2|2017-04-11|
US9083983B2|2015-07-14|
EP2764691A1|2014-08-13|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
US7206346B2|1997-06-25|2007-04-17|Nippon Telegraph And Telephone Corporation|Motion vector predictive encoding method, motion vector decoding method, predictive encoding apparatus and decoding apparatus, and storage media storing motion vector predictive encoding and decoding programs|
US8275047B2|2001-09-20|2012-09-25|Xilinx, Inc.|Method and device for block-based conditional motion compensation|
US7376186B2|2002-07-15|2008-05-20|Thomson Licensing|Motion estimation with weighting prediction|
US20050013498A1|2003-07-18|2005-01-20|Microsoft Corporation|Coding of motion vector information|
JP2005065239A|2003-07-28|2005-03-10|Matsushita Electric Ind Co Ltd|動画像の復号化装置|
KR100688383B1|2004-08-13|2007-03-02|경희대학교 산학협력단|파노라마 영상의 움직임 추정 및 보상|
US7623682B2|2004-08-13|2009-11-24|Samsung Electronics Co., Ltd.|Method and device for motion estimation and compensation for panorama image|
US20090316786A1|2006-04-14|2009-12-24|Nxp B.V.|Motion estimation at image borders|
US8345763B2|2007-11-27|2013-01-01|Mediatek Inc.|Motion compensation method and integrated circuit utilizing the same|
JPWO2010035735A1|2008-09-24|2012-02-23|ソニー株式会社|画像処理装置および方法|
WO2010041856A2|2008-10-06|2010-04-15|Lg Electronics Inc.|A method and an apparatus for processing a video signal|
KR101671460B1|2009-09-10|2016-11-02|에스케이 텔레콤주식회사|움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치|
TWI566586B|2009-10-20|2017-01-11|湯姆生特許公司|一序列形象的現時區塊之寫碼方法和重建方法|
US9497481B2|2010-02-09|2016-11-15|Nippon Telegraph And Telephone Corporation|Motion vector predictive encoding method, motion vector predictive decoding method, moving picture encoding apparatus, moving picture decoding apparatus, and programs thereof|
HUE041324T2|2010-05-25|2019-05-28|Lg Electronics Inc|Új síkbani elõrejelzés üzemmód|
EP2664139A2|2011-01-14|2013-11-20|Telefonaktiebolaget LM Ericsson |A method for deblocking filter control and a deblocking filtering control device|
WO2013001818A1|2011-06-30|2013-01-03|パナソニック株式会社|画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、および、画像符号化復号装置|
CA2843560C|2011-08-03|2020-09-22|Panasonic Corporation|Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus|
US20130094586A1|2011-10-17|2013-04-18|Lsi Corporation|Direct Memory Access With On-The-Fly Generation of Frame Information For Unrestricted Motion Vectors|
JP6422011B2|2012-05-11|2018-11-14|サン パテント トラスト|動画像符号化方法、動画像復号化方法、動画像符号化装置および動画像復号化装置|CN107277548B|2011-08-29|2019-12-06|苗太平洋控股有限公司|以合并模式对图像编码的方法|
US9300975B2|2011-09-11|2016-03-29|Texas Instruments Incorporated|Concurrent access shared buffer in a video encoder|
KR101539107B1|2011-10-18|2015-07-24|주식회사 케이티|영상 부호화 방법, 영상 복호화 방법, 영상 부호화기 및 영상 복호화기|
US9571833B2|2011-11-04|2017-02-14|Nokia Technologies Oy|Method for coding and an apparatus|
KR20130050149A|2011-11-07|2013-05-15|오수미|인터 모드에서의 예측 블록 생성 방법|
KR20130055773A|2011-11-21|2013-05-29|한국전자통신연구원|부호화 방법 및 장치|
CN108093254B|2011-12-23|2020-04-17|韩国电子通信研究院|图像解码方法、图像编码方法和记录介质|
KR102186605B1|2012-09-28|2020-12-03|삼성전자주식회사|다시점 영상 부호화/복호화 장치 및 방법|
CN102883163B|2012-10-08|2014-05-28|华为技术有限公司|用于运动矢量预测的运动矢量列表建立的方法、装置|
WO2015005753A1|2013-07-12|2015-01-15|삼성전자 주식회사|깊이 기반 디스패리티 벡터를 이용하는 인터 레이어 비디오 복호화 방법 및 그 장치, 깊이 기반 디스패리티 벡터를 이용하는 인터 레이어 비디오 부호화 방법 및 장치|
US20150271512A1|2014-03-18|2015-09-24|Texas Instruments Incorporated|Dynamic frame padding in a video hardware engine|
US10104397B2|2014-05-28|2018-10-16|Mediatek Inc.|Video processing apparatus for storing partial reconstructed pixel data in storage device for use in intra prediction and related video processing method|
KR20170019363A|2014-06-18|2017-02-21|삼성전자주식회사|휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치|
US9877043B2|2014-06-19|2018-01-23|Vid Scale Inc.|Methods and systems for intra block copy coding with block vector derivation|
WO2016119104A1|2015-01-26|2016-08-04|Mediatek Inc.|Motion vector regularization|
US10382791B2|2015-03-06|2019-08-13|Qualcomm Incorporated|Data structure for video coding unit|
US10271064B2|2015-06-11|2019-04-23|Qualcomm Incorporated|Sub-prediction unit motion vector prediction using spatial and/or temporal motion information|
US10341682B2|2016-01-19|2019-07-02|Peking University Shenzhen Graduate School|Methods and devices for panoramic video coding and decoding based on multi-mode boundary fill|
WO2017176092A1|2016-04-08|2017-10-12|한국전자통신연구원|움직임 예측 정보를 유도하는 방법 및 장치|
KR20180000279A|2016-06-21|2018-01-02|주식회사 픽스트리|부호화 장치 및 방법, 복호화 장치 및 방법|
WO2017222301A1|2016-06-21|2017-12-28|주식회사 픽스트리|부호화 장치 및 방법, 복호화 장치 및 방법|
US10165300B2|2016-10-28|2018-12-25|Blackberry Limited|3D transform and inter prediction for video coding|
US10785494B2|2017-10-11|2020-09-22|Qualcomm Incorporated|Low-complexity design for FRUC|
WO2019135447A1|2018-01-02|2019-07-11|삼성전자 주식회사|움직임 예측에 의한 패딩 기법을 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치|
KR20210097230A|2018-07-18|2021-08-06|베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드|히스토리-기반 모션 벡터 예측을 사용한 비디오 코딩 방법 및 장치|
WO2020060351A1|2018-09-21|2020-03-26|엘지전자 주식회사|움직임 벡터를 도출하는 방법 및 그 장치|
US11070796B2|2018-09-28|2021-07-20|Qualcomm Incorporated|Ultimate motion vector expression based pruning for video coding|
US11252406B2|2018-11-07|2022-02-15|Mediatek Inc.|Method and apparatus of encoding or decoding video blocks by current picture referencing coding|
WO2020156534A1|2019-02-01|2020-08-06|Beijing Bytedance Network Technology Co., Ltd.|Interactions between in-loop reshaping and intra block copy|
WO2020164628A1|2019-02-17|2020-08-20|Beijing Bytedance Network Technology Co., Ltd.|Motion candidate list construction for intra block copymode and non-ibc inter mode|
US11140388B2|2019-09-06|2021-10-05|Tencent America LLC|Method and apparatus for non-linear loop filtering|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
US201161543181P| true| 2011-10-04|2011-10-04||
US201161553053P| true| 2011-10-28|2011-10-28||
US13/532,392|US9083983B2|2011-10-04|2012-06-25|Motion vector predictor candidate clipping removal for video coding|
[返回顶部]